#ifndef CUFFTDX_FFT_28_FP16_FWD_PTX_HPP
#define CUFFTDX_FFT_28_FP16_FWD_PTX_HPP



template<> __forceinline__ __device__ void cufftdx_private_function<758, __half2, 1>(cufftdx::detail::complex<__half2> *rmem, unsigned smem){

asm volatile (R"({
.reg .b16 rs<163>;
.reg .b32 r<3515>;
.reg .f64 fd<150>;
.reg .b64 rd<3>;
mov.f64 fd99, 0d3FE3F3A0E28BEDD1;
{
cvt.rn.f16.f64 rs1, fd99;
}
mov.b32 r420, {rs1, rs1};
mov.f64 fd113, 0dBFE904C37505DE4B;
{
cvt.rn.f16.f64 rs2, fd113;
}
mov.b32 r447, {rs2, rs2};
mov.f64 fd118, 0dBFCC7B90E3024582;
{
cvt.rn.f16.f64 rs3, fd118;
}
mov.b32 r654, {rs3, rs3};
mov.f64 fd117, 0dBFEF329C0558E969;
{
cvt.rn.f16.f64 rs4, fd117;
}
mov.b32 r678, {rs4, rs4};
mov.f64 fd115, 0dBFECD4BCA9CB5C71;
{
cvt.rn.f16.f64 rs5, fd115;
}
mov.b32 r636, {rs5, rs5};
mov.f64 fd116, 0dBFDBC4C04D71ABC1;
{
cvt.rn.f16.f64 rs6, fd116;
}
mov.b32 r663, {rs6, rs6};
{
cvt.rn.f16.f64 rs7, fd115;
}
mov.b32 r537, {rs7, rs7};
{
cvt.rn.f16.f64 rs8, fd116;
}
{
neg.f16 rs9, rs8;
}
mov.b32 r561, {rs9, rs9};
{
cvt.rn.f16.f64 rs11, fd99;
}
mov.b32 r645, {rs11, rs11};
{
cvt.rn.f16.f64 rs12, fd113;
}
{
neg.f16 rs13, rs12;
}
mov.b32 r669, {rs13, rs13};
{
add.f16x2 r1, %66, %61;
}
{
add.f16x2 r4, %69, r1;
}
{
add.f16x2 r7, %57, %65;
}
{
add.f16x2 r10, r4, r7;
}
{
add.f16x2 r13, %60, %56;
}
{
add.f16x2 r16, r10, r13;
}
{
add.f16x2 r19, %63, %59;
}
{
add.f16x2 r22, %64, r19;
}
{
add.f16x2 r25, %68, %62;
}
{
add.f16x2 r28, r22, r25;
}
{
add.f16x2 r31, %58, %67;
}
{
add.f16x2 r34, r28, r31;
}
{
add.f16x2 r37, %66, %61;
}
{
mul.f16x2 r40, r37, r420;
}
{
add.f16x2 r43, %69, r40;
}
{
add.f16x2 r46, %57, %65;
}
{
mul.f16x2 r49, r46, r654;
}
{
add.f16x2 r52, r43, r49;
}
{
add.f16x2 r55, %60, %56;
}
{
mul.f16x2 r58, r55, r636;
}
{
add.f16x2 r61, r52, r58;
}
{
sub.f16x2 r64, %63, %59;
}
{
mul.f16x2 r67, r64, r447;
}
{
sub.f16x2 r70, %68, %62;
}
{
mul.f16x2 r73, r70, r678;
}
{
add.f16x2 r76, r67, r73;
}
{
sub.f16x2 r79, %58, %67;
}
{
mul.f16x2 r82, r79, r663;
}
{
add.f16x2 r85, r76, r82;
}
{
sub.f16x2 r88, r61, r85;
}
{
add.f16x2 r91, %66, %61;
}
{
mul.f16x2 r94, r91, r420;
}
{
add.f16x2 r97, %69, r94;
}
{
add.f16x2 r100, %57, %65;
}
{
mul.f16x2 r103, r100, r654;
}
{
add.f16x2 r106, r97, r103;
}
{
add.f16x2 r109, %60, %56;
}
{
mul.f16x2 r112, r109, r636;
}
{
add.f16x2 r115, r106, r112;
}
{
sub.f16x2 r118, %63, %59;
}
{
mul.f16x2 r121, r118, r447;
}
{
sub.f16x2 r124, %68, %62;
}
{
mul.f16x2 r127, r124, r678;
}
{
add.f16x2 r130, r121, r127;
}
{
sub.f16x2 r133, %58, %67;
}
{
mul.f16x2 r136, r133, r663;
}
{
add.f16x2 r139, r130, r136;
}
{
add.f16x2 r142, r115, r139;
}
{
add.f16x2 r145, %66, %61;
}
{
mul.f16x2 r148, r145, r654;
}
{
add.f16x2 r151, %69, r148;
}
{
add.f16x2 r154, %57, %65;
}
{
mul.f16x2 r157, r154, r537;
}
{
add.f16x2 r160, r151, r157;
}
{
add.f16x2 r163, %60, %56;
}
{
mul.f16x2 r166, r163, r645;
}
{
add.f16x2 r169, r160, r166;
}
{
sub.f16x2 r172, %63, %59;
}
{
mul.f16x2 r175, r172, r678;
}
{
sub.f16x2 r178, %68, %62;
}
{
mul.f16x2 r181, r178, r561;
}
{
add.f16x2 r184, r175, r181;
}
{
sub.f16x2 r187, %58, %67;
}
{
mul.f16x2 r190, r187, r669;
}
{
add.f16x2 r193, r184, r190;
}
{
sub.f16x2 r196, r169, r193;
}
{
add.f16x2 r199, %66, %61;
}
{
mul.f16x2 r202, r199, r654;
}
{
add.f16x2 r205, %69, r202;
}
{
add.f16x2 r208, %57, %65;
}
{
mul.f16x2 r211, r208, r537;
}
{
add.f16x2 r214, r205, r211;
}
{
add.f16x2 r217, %60, %56;
}
{
mul.f16x2 r220, r217, r645;
}
{
add.f16x2 r223, r214, r220;
}
{
sub.f16x2 r226, %63, %59;
}
{
mul.f16x2 r229, r226, r678;
}
{
sub.f16x2 r232, %68, %62;
}
{
mul.f16x2 r235, r232, r561;
}
{
add.f16x2 r238, r229, r235;
}
{
sub.f16x2 r241, %58, %67;
}
{
mul.f16x2 r244, r241, r669;
}
{
add.f16x2 r247, r238, r244;
}
{
add.f16x2 r250, r223, r247;
}
{
add.f16x2 r253, %66, %61;
}
{
mul.f16x2 r256, r253, r636;
}
{
add.f16x2 r259, %69, r256;
}
{
add.f16x2 r262, %57, %65;
}
{
mul.f16x2 r265, r262, r645;
}
{
add.f16x2 r268, r259, r265;
}
{
add.f16x2 r271, %60, %56;
}
{
mul.f16x2 r274, r271, r654;
}
{
add.f16x2 r277, r268, r274;
}
{
sub.f16x2 r280, %63, %59;
}
{
mul.f16x2 r283, r280, r663;
}
{
sub.f16x2 r286, %68, %62;
}
{
mul.f16x2 r289, r286, r669;
}
{
add.f16x2 r292, r283, r289;
}
{
sub.f16x2 r295, %58, %67;
}
{
mul.f16x2 r298, r295, r678;
}
{
add.f16x2 r301, r292, r298;
}
{
sub.f16x2 r304, r277, r301;
}
{
add.f16x2 r307, %66, %61;
}
{
mul.f16x2 r310, r307, r636;
}
{
add.f16x2 r313, %69, r310;
}
{
add.f16x2 r316, %57, %65;
}
{
mul.f16x2 r319, r316, r645;
}
{
add.f16x2 r322, r313, r319;
}
{
add.f16x2 r325, %60, %56;
}
{
mul.f16x2 r328, r325, r654;
}
{
add.f16x2 r331, r322, r328;
}
{
sub.f16x2 r334, %63, %59;
}
{
mul.f16x2 r337, r334, r663;
}
{
sub.f16x2 r340, %68, %62;
}
{
mul.f16x2 r343, r340, r669;
}
{
add.f16x2 r346, r337, r343;
}
{
sub.f16x2 r349, %58, %67;
}
{
mul.f16x2 r352, r349, r678;
}
{
add.f16x2 r355, r346, r352;
}
{
add.f16x2 r358, r331, r355;
}
{
add.f16x2 r361, %63, %59;
}
{
mul.f16x2 r364, r361, r420;
}
{
add.f16x2 r367, %64, r364;
}
{
add.f16x2 r370, %68, %62;
}
{
mul.f16x2 r373, r370, r654;
}
{
add.f16x2 r376, r367, r373;
}
{
add.f16x2 r379, %58, %67;
}
{
mul.f16x2 r382, r379, r636;
}
{
add.f16x2 r385, r376, r382;
}
{
sub.f16x2 r388, %66, %61;
}
{
mul.f16x2 r391, r388, r447;
}
{
sub.f16x2 r394, %57, %65;
}
{
mul.f16x2 r397, r394, r678;
}
{
add.f16x2 r400, r391, r397;
}
{
sub.f16x2 r403, %60, %56;
}
{
mul.f16x2 r406, r403, r663;
}
{
add.f16x2 r409, r400, r406;
}
{
add.f16x2 r412, r385, r409;
}
{
add.f16x2 r415, %63, %59;
}
{
mul.f16x2 r418, r415, r420;
}
{
add.f16x2 r421, %64, r418;
}
{
add.f16x2 r424, %68, %62;
}
{
mul.f16x2 r427, r424, r654;
}
{
add.f16x2 r430, r421, r427;
}
{
add.f16x2 r433, %58, %67;
}
{
mul.f16x2 r436, r433, r636;
}
{
add.f16x2 r439, r430, r436;
}
{
sub.f16x2 r442, %66, %61;
}
{
mul.f16x2 r445, r442, r447;
}
{
sub.f16x2 r448, %57, %65;
}
{
mul.f16x2 r451, r448, r678;
}
{
add.f16x2 r454, r445, r451;
}
{
sub.f16x2 r457, %60, %56;
}
{
mul.f16x2 r460, r457, r663;
}
{
add.f16x2 r463, r454, r460;
}
{
sub.f16x2 r466, r439, r463;
}
{
add.f16x2 r469, %63, %59;
}
{
mul.f16x2 r472, r469, r654;
}
{
add.f16x2 r475, %64, r472;
}
{
add.f16x2 r478, %68, %62;
}
{
mul.f16x2 r481, r478, r537;
}
{
add.f16x2 r484, r475, r481;
}
{
add.f16x2 r487, %58, %67;
}
{
mul.f16x2 r490, r487, r645;
}
{
add.f16x2 r493, r484, r490;
}
{
sub.f16x2 r496, %66, %61;
}
{
mul.f16x2 r499, r496, r678;
}
{
sub.f16x2 r502, %57, %65;
}
{
mul.f16x2 r505, r502, r561;
}
{
add.f16x2 r508, r499, r505;
}
{
sub.f16x2 r511, %60, %56;
}
{
mul.f16x2 r514, r511, r669;
}
{
add.f16x2 r517, r508, r514;
}
{
add.f16x2 r520, r493, r517;
}
{
add.f16x2 r523, %63, %59;
}
{
mul.f16x2 r526, r523, r654;
}
{
add.f16x2 r529, %64, r526;
}
{
add.f16x2 r532, %68, %62;
}
{
mul.f16x2 r535, r532, r537;
}
{
add.f16x2 r538, r529, r535;
}
{
add.f16x2 r541, %58, %67;
}
{
mul.f16x2 r544, r541, r645;
}
{
add.f16x2 r547, r538, r544;
}
{
sub.f16x2 r550, %66, %61;
}
{
mul.f16x2 r553, r550, r678;
}
{
sub.f16x2 r556, %57, %65;
}
{
mul.f16x2 r559, r556, r561;
}
{
add.f16x2 r562, r553, r559;
}
{
sub.f16x2 r565, %60, %56;
}
{
mul.f16x2 r568, r565, r669;
}
{
add.f16x2 r571, r562, r568;
}
{
sub.f16x2 r574, r547, r571;
}
{
add.f16x2 r577, %63, %59;
}
{
mul.f16x2 r580, r577, r636;
}
{
add.f16x2 r583, %64, r580;
}
{
add.f16x2 r586, %68, %62;
}
{
mul.f16x2 r589, r586, r645;
}
{
add.f16x2 r592, r583, r589;
}
{
add.f16x2 r595, %58, %67;
}
{
mul.f16x2 r598, r595, r654;
}
{
add.f16x2 r601, r592, r598;
}
{
sub.f16x2 r604, %66, %61;
}
{
mul.f16x2 r607, r604, r663;
}
{
sub.f16x2 r610, %57, %65;
}
{
mul.f16x2 r613, r610, r669;
}
{
add.f16x2 r616, r607, r613;
}
{
sub.f16x2 r619, %60, %56;
}
{
mul.f16x2 r622, r619, r678;
}
{
add.f16x2 r625, r616, r622;
}
{
add.f16x2 r628, r601, r625;
}
{
add.f16x2 r631, %63, %59;
}
{
mul.f16x2 r634, r631, r636;
}
{
add.f16x2 r637, %64, r634;
}
{
add.f16x2 r640, %68, %62;
}
{
mul.f16x2 r643, r640, r645;
}
{
add.f16x2 r646, r637, r643;
}
{
add.f16x2 r649, %58, %67;
}
{
mul.f16x2 r652, r649, r654;
}
{
add.f16x2 r655, r646, r652;
}
{
sub.f16x2 r658, %66, %61;
}
{
mul.f16x2 r661, r658, r663;
}
{
sub.f16x2 r664, %57, %65;
}
{
mul.f16x2 r667, r664, r669;
}
{
add.f16x2 r670, r661, r667;
}
{
sub.f16x2 r673, %60, %56;
}
{
mul.f16x2 r676, r673, r678;
}
{
add.f16x2 r679, r670, r676;
}
{
sub.f16x2 r682, r655, r679;
}
{
cvt.rn.f16.f64 rs15, fd99;
}
mov.b32 r1104, {rs15, rs15};
{
cvt.rn.f16.f64 rs16, fd113;
}
mov.b32 r1131, {rs16, rs16};
{
cvt.rn.f16.f64 rs17, fd118;
}
mov.b32 r1338, {rs17, rs17};
{
cvt.rn.f16.f64 rs18, fd117;
}
mov.b32 r1362, {rs18, rs18};
{
cvt.rn.f16.f64 rs19, fd115;
}
mov.b32 r1320, {rs19, rs19};
{
cvt.rn.f16.f64 rs20, fd116;
}
mov.b32 r1347, {rs20, rs20};
{
cvt.rn.f16.f64 rs21, fd115;
}
mov.b32 r1221, {rs21, rs21};
{
cvt.rn.f16.f64 rs22, fd116;
}
{
neg.f16 rs23, rs22;
}
mov.b32 r1245, {rs23, rs23};
{
cvt.rn.f16.f64 rs25, fd99;
}
mov.b32 r1329, {rs25, rs25};
{
cvt.rn.f16.f64 rs26, fd113;
}
{
neg.f16 rs27, rs26;
}
mov.b32 r1353, {rs27, rs27};
{
add.f16x2 r685, %72, %81;
}
{
add.f16x2 r688, %75, r685;
}
{
add.f16x2 r691, %77, %71;
}
{
add.f16x2 r694, r688, r691;
}
{
add.f16x2 r697, %80, %76;
}
{
add.f16x2 r700, r694, r697;
}
{
add.f16x2 r703, %83, %79;
}
{
add.f16x2 r706, %70, r703;
}
{
add.f16x2 r709, %74, %82;
}
{
add.f16x2 r712, r706, r709;
}
{
add.f16x2 r715, %78, %73;
}
{
add.f16x2 r718, r712, r715;
}
{
add.f16x2 r721, %72, %81;
}
{
mul.f16x2 r724, r721, r1104;
}
{
add.f16x2 r727, %75, r724;
}
{
add.f16x2 r730, %77, %71;
}
{
mul.f16x2 r733, r730, r1338;
}
{
add.f16x2 r736, r727, r733;
}
{
add.f16x2 r739, %80, %76;
}
{
mul.f16x2 r742, r739, r1320;
}
{
add.f16x2 r745, r736, r742;
}
{
sub.f16x2 r748, %83, %79;
}
{
mul.f16x2 r751, r748, r1131;
}
{
sub.f16x2 r754, %74, %82;
}
{
mul.f16x2 r757, r754, r1362;
}
{
add.f16x2 r760, r751, r757;
}
{
sub.f16x2 r763, %78, %73;
}
{
mul.f16x2 r766, r763, r1347;
}
{
add.f16x2 r769, r760, r766;
}
{
sub.f16x2 r772, r745, r769;
}
{
add.f16x2 r775, %72, %81;
}
{
mul.f16x2 r778, r775, r1104;
}
{
add.f16x2 r781, %75, r778;
}
{
add.f16x2 r784, %77, %71;
}
{
mul.f16x2 r787, r784, r1338;
}
{
add.f16x2 r790, r781, r787;
}
{
add.f16x2 r793, %80, %76;
}
{
mul.f16x2 r796, r793, r1320;
}
{
add.f16x2 r799, r790, r796;
}
{
sub.f16x2 r802, %83, %79;
}
{
mul.f16x2 r805, r802, r1131;
}
{
sub.f16x2 r808, %74, %82;
}
{
mul.f16x2 r811, r808, r1362;
}
{
add.f16x2 r814, r805, r811;
}
{
sub.f16x2 r817, %78, %73;
}
{
mul.f16x2 r820, r817, r1347;
}
{
add.f16x2 r823, r814, r820;
}
{
add.f16x2 r826, r799, r823;
}
{
add.f16x2 r829, %72, %81;
}
{
mul.f16x2 r832, r829, r1338;
}
{
add.f16x2 r835, %75, r832;
}
{
add.f16x2 r838, %77, %71;
}
{
mul.f16x2 r841, r838, r1221;
}
{
add.f16x2 r844, r835, r841;
}
{
add.f16x2 r847, %80, %76;
}
{
mul.f16x2 r850, r847, r1329;
}
{
add.f16x2 r853, r844, r850;
}
{
sub.f16x2 r856, %83, %79;
}
{
mul.f16x2 r859, r856, r1362;
}
{
sub.f16x2 r862, %74, %82;
}
{
mul.f16x2 r865, r862, r1245;
}
{
add.f16x2 r868, r859, r865;
}
{
sub.f16x2 r871, %78, %73;
}
{
mul.f16x2 r874, r871, r1353;
}
{
add.f16x2 r877, r868, r874;
}
{
sub.f16x2 r880, r853, r877;
}
{
add.f16x2 r883, %72, %81;
}
{
mul.f16x2 r886, r883, r1338;
}
{
add.f16x2 r889, %75, r886;
}
{
add.f16x2 r892, %77, %71;
}
{
mul.f16x2 r895, r892, r1221;
}
{
add.f16x2 r898, r889, r895;
}
{
add.f16x2 r901, %80, %76;
}
{
mul.f16x2 r904, r901, r1329;
}
{
add.f16x2 r907, r898, r904;
}
{
sub.f16x2 r910, %83, %79;
}
{
mul.f16x2 r913, r910, r1362;
}
{
sub.f16x2 r916, %74, %82;
}
{
mul.f16x2 r919, r916, r1245;
}
{
add.f16x2 r922, r913, r919;
}
{
sub.f16x2 r925, %78, %73;
}
{
mul.f16x2 r928, r925, r1353;
}
{
add.f16x2 r931, r922, r928;
}
{
add.f16x2 r934, r907, r931;
}
{
add.f16x2 r937, %72, %81;
}
{
mul.f16x2 r940, r937, r1320;
}
{
add.f16x2 r943, %75, r940;
}
{
add.f16x2 r946, %77, %71;
}
{
mul.f16x2 r949, r946, r1329;
}
{
add.f16x2 r952, r943, r949;
}
{
add.f16x2 r955, %80, %76;
}
{
mul.f16x2 r958, r955, r1338;
}
{
add.f16x2 r961, r952, r958;
}
{
sub.f16x2 r964, %83, %79;
}
{
mul.f16x2 r967, r964, r1347;
}
{
sub.f16x2 r970, %74, %82;
}
{
mul.f16x2 r973, r970, r1353;
}
{
add.f16x2 r976, r967, r973;
}
{
sub.f16x2 r979, %78, %73;
}
{
mul.f16x2 r982, r979, r1362;
}
{
add.f16x2 r985, r976, r982;
}
{
sub.f16x2 r988, r961, r985;
}
{
add.f16x2 r991, %72, %81;
}
{
mul.f16x2 r994, r991, r1320;
}
{
add.f16x2 r997, %75, r994;
}
{
add.f16x2 r1000, %77, %71;
}
{
mul.f16x2 r1003, r1000, r1329;
}
{
add.f16x2 r1006, r997, r1003;
}
{
add.f16x2 r1009, %80, %76;
}
{
mul.f16x2 r1012, r1009, r1338;
}
{
add.f16x2 r1015, r1006, r1012;
}
{
sub.f16x2 r1018, %83, %79;
}
{
mul.f16x2 r1021, r1018, r1347;
}
{
sub.f16x2 r1024, %74, %82;
}
{
mul.f16x2 r1027, r1024, r1353;
}
{
add.f16x2 r1030, r1021, r1027;
}
{
sub.f16x2 r1033, %78, %73;
}
{
mul.f16x2 r1036, r1033, r1362;
}
{
add.f16x2 r1039, r1030, r1036;
}
{
add.f16x2 r1042, r1015, r1039;
}
{
add.f16x2 r1045, %83, %79;
}
{
mul.f16x2 r1048, r1045, r1104;
}
{
add.f16x2 r1051, %70, r1048;
}
{
add.f16x2 r1054, %74, %82;
}
{
mul.f16x2 r1057, r1054, r1338;
}
{
add.f16x2 r1060, r1051, r1057;
}
{
add.f16x2 r1063, %78, %73;
}
{
mul.f16x2 r1066, r1063, r1320;
}
{
add.f16x2 r1069, r1060, r1066;
}
{
sub.f16x2 r1072, %72, %81;
}
{
mul.f16x2 r1075, r1072, r1131;
}
{
sub.f16x2 r1078, %77, %71;
}
{
mul.f16x2 r1081, r1078, r1362;
}
{
add.f16x2 r1084, r1075, r1081;
}
{
sub.f16x2 r1087, %80, %76;
}
{
mul.f16x2 r1090, r1087, r1347;
}
{
add.f16x2 r1093, r1084, r1090;
}
{
add.f16x2 r1096, r1069, r1093;
}
{
add.f16x2 r1099, %83, %79;
}
{
mul.f16x2 r1102, r1099, r1104;
}
{
add.f16x2 r1105, %70, r1102;
}
{
add.f16x2 r1108, %74, %82;
}
{
mul.f16x2 r1111, r1108, r1338;
}
{
add.f16x2 r1114, r1105, r1111;
}
{
add.f16x2 r1117, %78, %73;
}
{
mul.f16x2 r1120, r1117, r1320;
}
{
add.f16x2 r1123, r1114, r1120;
}
{
sub.f16x2 r1126, %72, %81;
}
{
mul.f16x2 r1129, r1126, r1131;
}
{
sub.f16x2 r1132, %77, %71;
}
{
mul.f16x2 r1135, r1132, r1362;
}
{
add.f16x2 r1138, r1129, r1135;
}
{
sub.f16x2 r1141, %80, %76;
}
{
mul.f16x2 r1144, r1141, r1347;
}
{
add.f16x2 r1147, r1138, r1144;
}
{
sub.f16x2 r1150, r1123, r1147;
}
{
add.f16x2 r1153, %83, %79;
}
{
mul.f16x2 r1156, r1153, r1338;
}
{
add.f16x2 r1159, %70, r1156;
}
{
add.f16x2 r1162, %74, %82;
}
{
mul.f16x2 r1165, r1162, r1221;
}
{
add.f16x2 r1168, r1159, r1165;
}
{
add.f16x2 r1171, %78, %73;
}
{
mul.f16x2 r1174, r1171, r1329;
}
{
add.f16x2 r1177, r1168, r1174;
}
{
sub.f16x2 r1180, %72, %81;
}
{
mul.f16x2 r1183, r1180, r1362;
}
{
sub.f16x2 r1186, %77, %71;
}
{
mul.f16x2 r1189, r1186, r1245;
}
{
add.f16x2 r1192, r1183, r1189;
}
{
sub.f16x2 r1195, %80, %76;
}
{
mul.f16x2 r1198, r1195, r1353;
}
{
add.f16x2 r1201, r1192, r1198;
}
{
add.f16x2 r1204, r1177, r1201;
}
{
add.f16x2 r1207, %83, %79;
}
{
mul.f16x2 r1210, r1207, r1338;
}
{
add.f16x2 r1213, %70, r1210;
}
{
add.f16x2 r1216, %74, %82;
}
{
mul.f16x2 r1219, r1216, r1221;
}
{
add.f16x2 r1222, r1213, r1219;
}
{
add.f16x2 r1225, %78, %73;
}
{
mul.f16x2 r1228, r1225, r1329;
}
{
add.f16x2 r1231, r1222, r1228;
}
{
sub.f16x2 r1234, %72, %81;
}
{
mul.f16x2 r1237, r1234, r1362;
}
{
sub.f16x2 r1240, %77, %71;
}
{
mul.f16x2 r1243, r1240, r1245;
}
{
add.f16x2 r1246, r1237, r1243;
}
{
sub.f16x2 r1249, %80, %76;
}
{
mul.f16x2 r1252, r1249, r1353;
}
{
add.f16x2 r1255, r1246, r1252;
}
{
sub.f16x2 r1258, r1231, r1255;
}
{
add.f16x2 r1261, %83, %79;
}
{
mul.f16x2 r1264, r1261, r1320;
}
{
add.f16x2 r1267, %70, r1264;
}
{
add.f16x2 r1270, %74, %82;
}
{
mul.f16x2 r1273, r1270, r1329;
}
{
add.f16x2 r1276, r1267, r1273;
}
{
add.f16x2 r1279, %78, %73;
}
{
mul.f16x2 r1282, r1279, r1338;
}
{
add.f16x2 r1285, r1276, r1282;
}
{
sub.f16x2 r1288, %72, %81;
}
{
mul.f16x2 r1291, r1288, r1347;
}
{
sub.f16x2 r1294, %77, %71;
}
{
mul.f16x2 r1297, r1294, r1353;
}
{
add.f16x2 r1300, r1291, r1297;
}
{
sub.f16x2 r1303, %80, %76;
}
{
mul.f16x2 r1306, r1303, r1362;
}
{
add.f16x2 r1309, r1300, r1306;
}
{
add.f16x2 r1312, r1285, r1309;
}
{
add.f16x2 r1315, %83, %79;
}
{
mul.f16x2 r1318, r1315, r1320;
}
{
add.f16x2 r1321, %70, r1318;
}
{
add.f16x2 r1324, %74, %82;
}
{
mul.f16x2 r1327, r1324, r1329;
}
{
add.f16x2 r1330, r1321, r1327;
}
{
add.f16x2 r1333, %78, %73;
}
{
mul.f16x2 r1336, r1333, r1338;
}
{
add.f16x2 r1339, r1330, r1336;
}
{
sub.f16x2 r1342, %72, %81;
}
{
mul.f16x2 r1345, r1342, r1347;
}
{
sub.f16x2 r1348, %77, %71;
}
{
mul.f16x2 r1351, r1348, r1353;
}
{
add.f16x2 r1354, r1345, r1351;
}
{
sub.f16x2 r1357, %80, %76;
}
{
mul.f16x2 r1360, r1357, r1362;
}
{
add.f16x2 r1363, r1354, r1360;
}
{
sub.f16x2 r1366, r1339, r1363;
}
mov.f64 fd95, 0d3FECD4BCA9CB5C71;
{
cvt.rn.f16.f64 rs29, fd95;
}
{
cvt.rn.f16.f64 rs30, fd116;
}
{
cvt.rn.f16.f64 rs31, fd99;
}
{
cvt.rn.f16.f64 rs32, fd113;
}
mov.f64 fd103, 0d3FCC7B90E3024582;
{
cvt.rn.f16.f64 rs33, fd103;
}
{
cvt.rn.f16.f64 rs34, fd117;
}
{
cvt.rn.f16.f64 rs35, fd118;
}
{
cvt.rn.f16.f64 rs36, fd117;
}
mov.f64 fd114, 0dBFE3F3A0E28BEDD1;
{
cvt.rn.f16.f64 rs37, fd114;
}
{
cvt.rn.f16.f64 rs38, fd113;
}
{
cvt.rn.f16.f64 rs39, fd115;
}
{
cvt.rn.f16.f64 rs40, fd116;
}
mov.b32 r1383, {rs29, rs29};
{
mul.f16x2 r1369, r772, r1383;
}
mov.b32 r1380, {rs30, rs30};
{
mul.f16x2 r1372, r1096, r1380;
}
{
sub.f16x2 r1375, r1369, r1372;
}
{
mul.f16x2 r1378, r772, r1380;
}
{
fma.rn.f16x2 r1381, r1096, r1383, r1378;
}
mov.b32 r1399, {rs31, rs31};
{
mul.f16x2 r1385, r880, r1399;
}
mov.b32 r1396, {rs32, rs32};
{
mul.f16x2 r1388, r1204, r1396;
}
{
sub.f16x2 r1391, r1385, r1388;
}
{
mul.f16x2 r1394, r880, r1396;
}
{
fma.rn.f16x2 r1397, r1204, r1399, r1394;
}
mov.b32 r1415, {rs33, rs33};
{
mul.f16x2 r1401, r988, r1415;
}
mov.b32 r1412, {rs34, rs34};
{
mul.f16x2 r1404, r1312, r1412;
}
{
sub.f16x2 r1407, r1401, r1404;
}
{
mul.f16x2 r1410, r988, r1412;
}
{
fma.rn.f16x2 r1413, r1312, r1415, r1410;
}
mov.b32 r1431, {rs35, rs35};
{
mul.f16x2 r1417, r1042, r1431;
}
mov.b32 r1428, {rs36, rs36};
{
mul.f16x2 r1420, r1366, r1428;
}
{
sub.f16x2 r1423, r1417, r1420;
}
{
mul.f16x2 r1426, r1042, r1428;
}
{
fma.rn.f16x2 r1429, r1366, r1431, r1426;
}
mov.b32 r1447, {rs37, rs37};
{
mul.f16x2 r1433, r934, r1447;
}
mov.b32 r1444, {rs38, rs38};
{
mul.f16x2 r1436, r1258, r1444;
}
{
sub.f16x2 r1439, r1433, r1436;
}
{
mul.f16x2 r1442, r934, r1444;
}
{
fma.rn.f16x2 r1445, r1258, r1447, r1442;
}
mov.b32 r1463, {rs39, rs39};
{
mul.f16x2 r1449, r826, r1463;
}
mov.b32 r1460, {rs40, rs40};
{
mul.f16x2 r1452, r1150, r1460;
}
{
sub.f16x2 r1455, r1449, r1452;
}
{
mul.f16x2 r1458, r826, r1460;
}
{
fma.rn.f16x2 r1461, r1150, r1463, r1458;
}
{
add.f16x2 r1465, r16, r700;
}
{
add.f16x2 r1468, r34, r718;
}
{
sub.f16x2 r1471, r16, r700;
}
{
sub.f16x2 r1474, r34, r718;
}
{
add.f16x2 r1477, r88, r1375;
}
{
add.f16x2 r1480, r412, r1381;
}
{
sub.f16x2 r1483, r88, r1375;
}
{
sub.f16x2 r1486, r412, r1381;
}
{
add.f16x2 r1489, r196, r1391;
}
{
add.f16x2 r1492, r520, r1397;
}
{
sub.f16x2 r1495, r196, r1391;
}
{
sub.f16x2 r1498, r520, r1397;
}
{
add.f16x2 r1501, r304, r1407;
}
{
add.f16x2 r1504, r628, r1413;
}
{
sub.f16x2 r1507, r304, r1407;
}
{
sub.f16x2 r1510, r628, r1413;
}
{
add.f16x2 r1513, r358, r1423;
}
{
add.f16x2 r1516, r682, r1429;
}
{
sub.f16x2 r1519, r358, r1423;
}
{
sub.f16x2 r1522, r682, r1429;
}
{
add.f16x2 r1525, r250, r1439;
}
{
add.f16x2 r1528, r574, r1445;
}
{
sub.f16x2 r1531, r250, r1439;
}
{
sub.f16x2 r1534, r574, r1445;
}
{
add.f16x2 r1537, r142, r1455;
}
{
add.f16x2 r1540, r466, r1461;
}
{
sub.f16x2 r1543, r142, r1455;
}
{
sub.f16x2 r1546, r466, r1461;
}
{
cvt.rn.f16.f64 rs55, fd99;
}
mov.b32 r1968, {rs55, rs55};
{
cvt.rn.f16.f64 rs56, fd113;
}
mov.b32 r1995, {rs56, rs56};
{
cvt.rn.f16.f64 rs57, fd118;
}
mov.b32 r2202, {rs57, rs57};
{
cvt.rn.f16.f64 rs58, fd117;
}
mov.b32 r2226, {rs58, rs58};
{
cvt.rn.f16.f64 rs59, fd115;
}
mov.b32 r2184, {rs59, rs59};
{
cvt.rn.f16.f64 rs60, fd116;
}
mov.b32 r2211, {rs60, rs60};
{
cvt.rn.f16.f64 rs61, fd115;
}
mov.b32 r2085, {rs61, rs61};
{
cvt.rn.f16.f64 rs62, fd116;
}
{
neg.f16 rs63, rs62;
}
mov.b32 r2109, {rs63, rs63};
{
cvt.rn.f16.f64 rs65, fd99;
}
mov.b32 r2193, {rs65, rs65};
{
cvt.rn.f16.f64 rs66, fd113;
}
{
neg.f16 rs67, rs66;
}
mov.b32 r2217, {rs67, rs67};
{
add.f16x2 r1549, %88, %84;
}
{
add.f16x2 r1552, %92, r1549;
}
{
add.f16x2 r1555, %94, %89;
}
{
add.f16x2 r1558, r1552, r1555;
}
{
add.f16x2 r1561, %97, %93;
}
{
add.f16x2 r1564, r1558, r1561;
}
{
add.f16x2 r1567, %86, %96;
}
{
add.f16x2 r1570, %87, r1567;
}
{
add.f16x2 r1573, %91, %85;
}
{
add.f16x2 r1576, r1570, r1573;
}
{
add.f16x2 r1579, %95, %90;
}
{
add.f16x2 r1582, r1576, r1579;
}
{
add.f16x2 r1585, %88, %84;
}
{
mul.f16x2 r1588, r1585, r1968;
}
{
add.f16x2 r1591, %92, r1588;
}
{
add.f16x2 r1594, %94, %89;
}
{
mul.f16x2 r1597, r1594, r2202;
}
{
add.f16x2 r1600, r1591, r1597;
}
{
add.f16x2 r1603, %97, %93;
}
{
mul.f16x2 r1606, r1603, r2184;
}
{
add.f16x2 r1609, r1600, r1606;
}
{
sub.f16x2 r1612, %86, %96;
}
{
mul.f16x2 r1615, r1612, r1995;
}
{
sub.f16x2 r1618, %91, %85;
}
{
mul.f16x2 r1621, r1618, r2226;
}
{
add.f16x2 r1624, r1615, r1621;
}
{
sub.f16x2 r1627, %95, %90;
}
{
mul.f16x2 r1630, r1627, r2211;
}
{
add.f16x2 r1633, r1624, r1630;
}
{
sub.f16x2 r1636, r1609, r1633;
}
{
add.f16x2 r1639, %88, %84;
}
{
mul.f16x2 r1642, r1639, r1968;
}
{
add.f16x2 r1645, %92, r1642;
}
{
add.f16x2 r1648, %94, %89;
}
{
mul.f16x2 r1651, r1648, r2202;
}
{
add.f16x2 r1654, r1645, r1651;
}
{
add.f16x2 r1657, %97, %93;
}
{
mul.f16x2 r1660, r1657, r2184;
}
{
add.f16x2 r1663, r1654, r1660;
}
{
sub.f16x2 r1666, %86, %96;
}
{
mul.f16x2 r1669, r1666, r1995;
}
{
sub.f16x2 r1672, %91, %85;
}
{
mul.f16x2 r1675, r1672, r2226;
}
{
add.f16x2 r1678, r1669, r1675;
}
{
sub.f16x2 r1681, %95, %90;
}
{
mul.f16x2 r1684, r1681, r2211;
}
{
add.f16x2 r1687, r1678, r1684;
}
{
add.f16x2 r1690, r1663, r1687;
}
{
add.f16x2 r1693, %88, %84;
}
{
mul.f16x2 r1696, r1693, r2202;
}
{
add.f16x2 r1699, %92, r1696;
}
{
add.f16x2 r1702, %94, %89;
}
{
mul.f16x2 r1705, r1702, r2085;
}
{
add.f16x2 r1708, r1699, r1705;
}
{
add.f16x2 r1711, %97, %93;
}
{
mul.f16x2 r1714, r1711, r2193;
}
{
add.f16x2 r1717, r1708, r1714;
}
{
sub.f16x2 r1720, %86, %96;
}
{
mul.f16x2 r1723, r1720, r2226;
}
{
sub.f16x2 r1726, %91, %85;
}
{
mul.f16x2 r1729, r1726, r2109;
}
{
add.f16x2 r1732, r1723, r1729;
}
{
sub.f16x2 r1735, %95, %90;
}
{
mul.f16x2 r1738, r1735, r2217;
}
{
add.f16x2 r1741, r1732, r1738;
}
{
sub.f16x2 r1744, r1717, r1741;
}
{
add.f16x2 r1747, %88, %84;
}
{
mul.f16x2 r1750, r1747, r2202;
}
{
add.f16x2 r1753, %92, r1750;
}
{
add.f16x2 r1756, %94, %89;
}
{
mul.f16x2 r1759, r1756, r2085;
}
{
add.f16x2 r1762, r1753, r1759;
}
{
add.f16x2 r1765, %97, %93;
}
{
mul.f16x2 r1768, r1765, r2193;
}
{
add.f16x2 r1771, r1762, r1768;
}
{
sub.f16x2 r1774, %86, %96;
}
{
mul.f16x2 r1777, r1774, r2226;
}
{
sub.f16x2 r1780, %91, %85;
}
{
mul.f16x2 r1783, r1780, r2109;
}
{
add.f16x2 r1786, r1777, r1783;
}
{
sub.f16x2 r1789, %95, %90;
}
{
mul.f16x2 r1792, r1789, r2217;
}
{
add.f16x2 r1795, r1786, r1792;
}
{
add.f16x2 r1798, r1771, r1795;
}
{
add.f16x2 r1801, %88, %84;
}
{
mul.f16x2 r1804, r1801, r2184;
}
{
add.f16x2 r1807, %92, r1804;
}
{
add.f16x2 r1810, %94, %89;
}
{
mul.f16x2 r1813, r1810, r2193;
}
{
add.f16x2 r1816, r1807, r1813;
}
{
add.f16x2 r1819, %97, %93;
}
{
mul.f16x2 r1822, r1819, r2202;
}
{
add.f16x2 r1825, r1816, r1822;
}
{
sub.f16x2 r1828, %86, %96;
}
{
mul.f16x2 r1831, r1828, r2211;
}
{
sub.f16x2 r1834, %91, %85;
}
{
mul.f16x2 r1837, r1834, r2217;
}
{
add.f16x2 r1840, r1831, r1837;
}
{
sub.f16x2 r1843, %95, %90;
}
{
mul.f16x2 r1846, r1843, r2226;
}
{
add.f16x2 r1849, r1840, r1846;
}
{
sub.f16x2 r1852, r1825, r1849;
}
{
add.f16x2 r1855, %88, %84;
}
{
mul.f16x2 r1858, r1855, r2184;
}
{
add.f16x2 r1861, %92, r1858;
}
{
add.f16x2 r1864, %94, %89;
}
{
mul.f16x2 r1867, r1864, r2193;
}
{
add.f16x2 r1870, r1861, r1867;
}
{
add.f16x2 r1873, %97, %93;
}
{
mul.f16x2 r1876, r1873, r2202;
}
{
add.f16x2 r1879, r1870, r1876;
}
{
sub.f16x2 r1882, %86, %96;
}
{
mul.f16x2 r1885, r1882, r2211;
}
{
sub.f16x2 r1888, %91, %85;
}
{
mul.f16x2 r1891, r1888, r2217;
}
{
add.f16x2 r1894, r1885, r1891;
}
{
sub.f16x2 r1897, %95, %90;
}
{
mul.f16x2 r1900, r1897, r2226;
}
{
add.f16x2 r1903, r1894, r1900;
}
{
add.f16x2 r1906, r1879, r1903;
}
{
add.f16x2 r1909, %86, %96;
}
{
mul.f16x2 r1912, r1909, r1968;
}
{
add.f16x2 r1915, %87, r1912;
}
{
add.f16x2 r1918, %91, %85;
}
{
mul.f16x2 r1921, r1918, r2202;
}
{
add.f16x2 r1924, r1915, r1921;
}
{
add.f16x2 r1927, %95, %90;
}
{
mul.f16x2 r1930, r1927, r2184;
}
{
add.f16x2 r1933, r1924, r1930;
}
{
sub.f16x2 r1936, %88, %84;
}
{
mul.f16x2 r1939, r1936, r1995;
}
{
sub.f16x2 r1942, %94, %89;
}
{
mul.f16x2 r1945, r1942, r2226;
}
{
add.f16x2 r1948, r1939, r1945;
}
{
sub.f16x2 r1951, %97, %93;
}
{
mul.f16x2 r1954, r1951, r2211;
}
{
add.f16x2 r1957, r1948, r1954;
}
{
add.f16x2 r1960, r1933, r1957;
}
{
add.f16x2 r1963, %86, %96;
}
{
mul.f16x2 r1966, r1963, r1968;
}
{
add.f16x2 r1969, %87, r1966;
}
{
add.f16x2 r1972, %91, %85;
}
{
mul.f16x2 r1975, r1972, r2202;
}
{
add.f16x2 r1978, r1969, r1975;
}
{
add.f16x2 r1981, %95, %90;
}
{
mul.f16x2 r1984, r1981, r2184;
}
{
add.f16x2 r1987, r1978, r1984;
}
{
sub.f16x2 r1990, %88, %84;
}
{
mul.f16x2 r1993, r1990, r1995;
}
{
sub.f16x2 r1996, %94, %89;
}
{
mul.f16x2 r1999, r1996, r2226;
}
{
add.f16x2 r2002, r1993, r1999;
}
{
sub.f16x2 r2005, %97, %93;
}
{
mul.f16x2 r2008, r2005, r2211;
}
{
add.f16x2 r2011, r2002, r2008;
}
{
sub.f16x2 r2014, r1987, r2011;
}
{
add.f16x2 r2017, %86, %96;
}
{
mul.f16x2 r2020, r2017, r2202;
}
{
add.f16x2 r2023, %87, r2020;
}
{
add.f16x2 r2026, %91, %85;
}
{
mul.f16x2 r2029, r2026, r2085;
}
{
add.f16x2 r2032, r2023, r2029;
}
{
add.f16x2 r2035, %95, %90;
}
{
mul.f16x2 r2038, r2035, r2193;
}
{
add.f16x2 r2041, r2032, r2038;
}
{
sub.f16x2 r2044, %88, %84;
}
{
mul.f16x2 r2047, r2044, r2226;
}
{
sub.f16x2 r2050, %94, %89;
}
{
mul.f16x2 r2053, r2050, r2109;
}
{
add.f16x2 r2056, r2047, r2053;
}
{
sub.f16x2 r2059, %97, %93;
}
{
mul.f16x2 r2062, r2059, r2217;
}
{
add.f16x2 r2065, r2056, r2062;
}
{
add.f16x2 r2068, r2041, r2065;
}
{
add.f16x2 r2071, %86, %96;
}
{
mul.f16x2 r2074, r2071, r2202;
}
{
add.f16x2 r2077, %87, r2074;
}
{
add.f16x2 r2080, %91, %85;
}
{
mul.f16x2 r2083, r2080, r2085;
}
{
add.f16x2 r2086, r2077, r2083;
}
{
add.f16x2 r2089, %95, %90;
}
{
mul.f16x2 r2092, r2089, r2193;
}
{
add.f16x2 r2095, r2086, r2092;
}
{
sub.f16x2 r2098, %88, %84;
}
{
mul.f16x2 r2101, r2098, r2226;
}
{
sub.f16x2 r2104, %94, %89;
}
{
mul.f16x2 r2107, r2104, r2109;
}
{
add.f16x2 r2110, r2101, r2107;
}
{
sub.f16x2 r2113, %97, %93;
}
{
mul.f16x2 r2116, r2113, r2217;
}
{
add.f16x2 r2119, r2110, r2116;
}
{
sub.f16x2 r2122, r2095, r2119;
}
{
add.f16x2 r2125, %86, %96;
}
{
mul.f16x2 r2128, r2125, r2184;
}
{
add.f16x2 r2131, %87, r2128;
}
{
add.f16x2 r2134, %91, %85;
}
{
mul.f16x2 r2137, r2134, r2193;
}
{
add.f16x2 r2140, r2131, r2137;
}
{
add.f16x2 r2143, %95, %90;
}
{
mul.f16x2 r2146, r2143, r2202;
}
{
add.f16x2 r2149, r2140, r2146;
}
{
sub.f16x2 r2152, %88, %84;
}
{
mul.f16x2 r2155, r2152, r2211;
}
{
sub.f16x2 r2158, %94, %89;
}
{
mul.f16x2 r2161, r2158, r2217;
}
{
add.f16x2 r2164, r2155, r2161;
}
{
sub.f16x2 r2167, %97, %93;
}
{
mul.f16x2 r2170, r2167, r2226;
}
{
add.f16x2 r2173, r2164, r2170;
}
{
add.f16x2 r2176, r2149, r2173;
}
{
add.f16x2 r2179, %86, %96;
}
{
mul.f16x2 r2182, r2179, r2184;
}
{
add.f16x2 r2185, %87, r2182;
}
{
add.f16x2 r2188, %91, %85;
}
{
mul.f16x2 r2191, r2188, r2193;
}
{
add.f16x2 r2194, r2185, r2191;
}
{
add.f16x2 r2197, %95, %90;
}
{
mul.f16x2 r2200, r2197, r2202;
}
{
add.f16x2 r2203, r2194, r2200;
}
{
sub.f16x2 r2206, %88, %84;
}
{
mul.f16x2 r2209, r2206, r2211;
}
{
sub.f16x2 r2212, %94, %89;
}
{
mul.f16x2 r2215, r2212, r2217;
}
{
add.f16x2 r2218, r2209, r2215;
}
{
sub.f16x2 r2221, %97, %93;
}
{
mul.f16x2 r2224, r2221, r2226;
}
{
add.f16x2 r2227, r2218, r2224;
}
{
sub.f16x2 r2230, r2203, r2227;
}
{
cvt.rn.f16.f64 rs69, fd99;
}
mov.b32 r2652, {rs69, rs69};
{
cvt.rn.f16.f64 rs70, fd113;
}
mov.b32 r2679, {rs70, rs70};
{
cvt.rn.f16.f64 rs71, fd118;
}
mov.b32 r2886, {rs71, rs71};
{
cvt.rn.f16.f64 rs72, fd117;
}
mov.b32 r2910, {rs72, rs72};
{
cvt.rn.f16.f64 rs73, fd115;
}
mov.b32 r2868, {rs73, rs73};
{
cvt.rn.f16.f64 rs74, fd116;
}
mov.b32 r2895, {rs74, rs74};
{
cvt.rn.f16.f64 rs75, fd115;
}
mov.b32 r2769, {rs75, rs75};
{
cvt.rn.f16.f64 rs76, fd116;
}
{
neg.f16 rs77, rs76;
}
mov.b32 r2793, {rs77, rs77};
{
cvt.rn.f16.f64 rs79, fd99;
}
mov.b32 r2877, {rs79, rs79};
{
cvt.rn.f16.f64 rs80, fd113;
}
{
neg.f16 rs81, rs80;
}
mov.b32 r2901, {rs81, rs81};
{
add.f16x2 r2233, %107, %102;
}
{
add.f16x2 r2236, %110, r2233;
}
{
add.f16x2 r2239, %98, %106;
}
{
add.f16x2 r2242, r2236, r2239;
}
{
add.f16x2 r2245, %101, %111;
}
{
add.f16x2 r2248, r2242, r2245;
}
{
add.f16x2 r2251, %104, %100;
}
{
add.f16x2 r2254, %105, r2251;
}
{
add.f16x2 r2257, %109, %103;
}
{
add.f16x2 r2260, r2254, r2257;
}
{
add.f16x2 r2263, %99, %108;
}
{
add.f16x2 r2266, r2260, r2263;
}
{
add.f16x2 r2269, %107, %102;
}
{
mul.f16x2 r2272, r2269, r2652;
}
{
add.f16x2 r2275, %110, r2272;
}
{
add.f16x2 r2278, %98, %106;
}
{
mul.f16x2 r2281, r2278, r2886;
}
{
add.f16x2 r2284, r2275, r2281;
}
{
add.f16x2 r2287, %101, %111;
}
{
mul.f16x2 r2290, r2287, r2868;
}
{
add.f16x2 r2293, r2284, r2290;
}
{
sub.f16x2 r2296, %104, %100;
}
{
mul.f16x2 r2299, r2296, r2679;
}
{
sub.f16x2 r2302, %109, %103;
}
{
mul.f16x2 r2305, r2302, r2910;
}
{
add.f16x2 r2308, r2299, r2305;
}
{
sub.f16x2 r2311, %99, %108;
}
{
mul.f16x2 r2314, r2311, r2895;
}
{
add.f16x2 r2317, r2308, r2314;
}
{
sub.f16x2 r2320, r2293, r2317;
}
{
add.f16x2 r2323, %107, %102;
}
{
mul.f16x2 r2326, r2323, r2652;
}
{
add.f16x2 r2329, %110, r2326;
}
{
add.f16x2 r2332, %98, %106;
}
{
mul.f16x2 r2335, r2332, r2886;
}
{
add.f16x2 r2338, r2329, r2335;
}
{
add.f16x2 r2341, %101, %111;
}
{
mul.f16x2 r2344, r2341, r2868;
}
{
add.f16x2 r2347, r2338, r2344;
}
{
sub.f16x2 r2350, %104, %100;
}
{
mul.f16x2 r2353, r2350, r2679;
}
{
sub.f16x2 r2356, %109, %103;
}
{
mul.f16x2 r2359, r2356, r2910;
}
{
add.f16x2 r2362, r2353, r2359;
}
{
sub.f16x2 r2365, %99, %108;
}
{
mul.f16x2 r2368, r2365, r2895;
}
{
add.f16x2 r2371, r2362, r2368;
}
{
add.f16x2 r2374, r2347, r2371;
}
{
add.f16x2 r2377, %107, %102;
}
{
mul.f16x2 r2380, r2377, r2886;
}
{
add.f16x2 r2383, %110, r2380;
}
{
add.f16x2 r2386, %98, %106;
}
{
mul.f16x2 r2389, r2386, r2769;
}
{
add.f16x2 r2392, r2383, r2389;
}
{
add.f16x2 r2395, %101, %111;
}
{
mul.f16x2 r2398, r2395, r2877;
}
{
add.f16x2 r2401, r2392, r2398;
}
{
sub.f16x2 r2404, %104, %100;
}
{
mul.f16x2 r2407, r2404, r2910;
}
{
sub.f16x2 r2410, %109, %103;
}
{
mul.f16x2 r2413, r2410, r2793;
}
{
add.f16x2 r2416, r2407, r2413;
}
{
sub.f16x2 r2419, %99, %108;
}
{
mul.f16x2 r2422, r2419, r2901;
}
{
add.f16x2 r2425, r2416, r2422;
}
{
sub.f16x2 r2428, r2401, r2425;
}
{
add.f16x2 r2431, %107, %102;
}
{
mul.f16x2 r2434, r2431, r2886;
}
{
add.f16x2 r2437, %110, r2434;
}
{
add.f16x2 r2440, %98, %106;
}
{
mul.f16x2 r2443, r2440, r2769;
}
{
add.f16x2 r2446, r2437, r2443;
}
{
add.f16x2 r2449, %101, %111;
}
{
mul.f16x2 r2452, r2449, r2877;
}
{
add.f16x2 r2455, r2446, r2452;
}
{
sub.f16x2 r2458, %104, %100;
}
{
mul.f16x2 r2461, r2458, r2910;
}
{
sub.f16x2 r2464, %109, %103;
}
{
mul.f16x2 r2467, r2464, r2793;
}
{
add.f16x2 r2470, r2461, r2467;
}
{
sub.f16x2 r2473, %99, %108;
}
{
mul.f16x2 r2476, r2473, r2901;
}
{
add.f16x2 r2479, r2470, r2476;
}
{
add.f16x2 r2482, r2455, r2479;
}
{
add.f16x2 r2485, %107, %102;
}
{
mul.f16x2 r2488, r2485, r2868;
}
{
add.f16x2 r2491, %110, r2488;
}
{
add.f16x2 r2494, %98, %106;
}
{
mul.f16x2 r2497, r2494, r2877;
}
{
add.f16x2 r2500, r2491, r2497;
}
{
add.f16x2 r2503, %101, %111;
}
{
mul.f16x2 r2506, r2503, r2886;
}
{
add.f16x2 r2509, r2500, r2506;
}
{
sub.f16x2 r2512, %104, %100;
}
{
mul.f16x2 r2515, r2512, r2895;
}
{
sub.f16x2 r2518, %109, %103;
}
{
mul.f16x2 r2521, r2518, r2901;
}
{
add.f16x2 r2524, r2515, r2521;
}
{
sub.f16x2 r2527, %99, %108;
}
{
mul.f16x2 r2530, r2527, r2910;
}
{
add.f16x2 r2533, r2524, r2530;
}
{
sub.f16x2 r2536, r2509, r2533;
}
{
add.f16x2 r2539, %107, %102;
}
{
mul.f16x2 r2542, r2539, r2868;
}
{
add.f16x2 r2545, %110, r2542;
}
{
add.f16x2 r2548, %98, %106;
}
{
mul.f16x2 r2551, r2548, r2877;
}
{
add.f16x2 r2554, r2545, r2551;
}
{
add.f16x2 r2557, %101, %111;
}
{
mul.f16x2 r2560, r2557, r2886;
}
{
add.f16x2 r2563, r2554, r2560;
}
{
sub.f16x2 r2566, %104, %100;
}
{
mul.f16x2 r2569, r2566, r2895;
}
{
sub.f16x2 r2572, %109, %103;
}
{
mul.f16x2 r2575, r2572, r2901;
}
{
add.f16x2 r2578, r2569, r2575;
}
{
sub.f16x2 r2581, %99, %108;
}
{
mul.f16x2 r2584, r2581, r2910;
}
{
add.f16x2 r2587, r2578, r2584;
}
{
add.f16x2 r2590, r2563, r2587;
}
{
add.f16x2 r2593, %104, %100;
}
{
mul.f16x2 r2596, r2593, r2652;
}
{
add.f16x2 r2599, %105, r2596;
}
{
add.f16x2 r2602, %109, %103;
}
{
mul.f16x2 r2605, r2602, r2886;
}
{
add.f16x2 r2608, r2599, r2605;
}
{
add.f16x2 r2611, %99, %108;
}
{
mul.f16x2 r2614, r2611, r2868;
}
{
add.f16x2 r2617, r2608, r2614;
}
{
sub.f16x2 r2620, %107, %102;
}
{
mul.f16x2 r2623, r2620, r2679;
}
{
sub.f16x2 r2626, %98, %106;
}
{
mul.f16x2 r2629, r2626, r2910;
}
{
add.f16x2 r2632, r2623, r2629;
}
{
sub.f16x2 r2635, %101, %111;
}
{
mul.f16x2 r2638, r2635, r2895;
}
{
add.f16x2 r2641, r2632, r2638;
}
{
add.f16x2 r2644, r2617, r2641;
}
{
add.f16x2 r2647, %104, %100;
}
{
mul.f16x2 r2650, r2647, r2652;
}
{
add.f16x2 r2653, %105, r2650;
}
{
add.f16x2 r2656, %109, %103;
}
{
mul.f16x2 r2659, r2656, r2886;
}
{
add.f16x2 r2662, r2653, r2659;
}
{
add.f16x2 r2665, %99, %108;
}
{
mul.f16x2 r2668, r2665, r2868;
}
{
add.f16x2 r2671, r2662, r2668;
}
{
sub.f16x2 r2674, %107, %102;
}
{
mul.f16x2 r2677, r2674, r2679;
}
{
sub.f16x2 r2680, %98, %106;
}
{
mul.f16x2 r2683, r2680, r2910;
}
{
add.f16x2 r2686, r2677, r2683;
}
{
sub.f16x2 r2689, %101, %111;
}
{
mul.f16x2 r2692, r2689, r2895;
}
{
add.f16x2 r2695, r2686, r2692;
}
{
sub.f16x2 r2698, r2671, r2695;
}
{
add.f16x2 r2701, %104, %100;
}
{
mul.f16x2 r2704, r2701, r2886;
}
{
add.f16x2 r2707, %105, r2704;
}
{
add.f16x2 r2710, %109, %103;
}
{
mul.f16x2 r2713, r2710, r2769;
}
{
add.f16x2 r2716, r2707, r2713;
}
{
add.f16x2 r2719, %99, %108;
}
{
mul.f16x2 r2722, r2719, r2877;
}
{
add.f16x2 r2725, r2716, r2722;
}
{
sub.f16x2 r2728, %107, %102;
}
{
mul.f16x2 r2731, r2728, r2910;
}
{
sub.f16x2 r2734, %98, %106;
}
{
mul.f16x2 r2737, r2734, r2793;
}
{
add.f16x2 r2740, r2731, r2737;
}
{
sub.f16x2 r2743, %101, %111;
}
{
mul.f16x2 r2746, r2743, r2901;
}
{
add.f16x2 r2749, r2740, r2746;
}
{
add.f16x2 r2752, r2725, r2749;
}
{
add.f16x2 r2755, %104, %100;
}
{
mul.f16x2 r2758, r2755, r2886;
}
{
add.f16x2 r2761, %105, r2758;
}
{
add.f16x2 r2764, %109, %103;
}
{
mul.f16x2 r2767, r2764, r2769;
}
{
add.f16x2 r2770, r2761, r2767;
}
{
add.f16x2 r2773, %99, %108;
}
{
mul.f16x2 r2776, r2773, r2877;
}
{
add.f16x2 r2779, r2770, r2776;
}
{
sub.f16x2 r2782, %107, %102;
}
{
mul.f16x2 r2785, r2782, r2910;
}
{
sub.f16x2 r2788, %98, %106;
}
{
mul.f16x2 r2791, r2788, r2793;
}
{
add.f16x2 r2794, r2785, r2791;
}
{
sub.f16x2 r2797, %101, %111;
}
{
mul.f16x2 r2800, r2797, r2901;
}
{
add.f16x2 r2803, r2794, r2800;
}
{
sub.f16x2 r2806, r2779, r2803;
}
{
add.f16x2 r2809, %104, %100;
}
{
mul.f16x2 r2812, r2809, r2868;
}
{
add.f16x2 r2815, %105, r2812;
}
{
add.f16x2 r2818, %109, %103;
}
{
mul.f16x2 r2821, r2818, r2877;
}
{
add.f16x2 r2824, r2815, r2821;
}
{
add.f16x2 r2827, %99, %108;
}
{
mul.f16x2 r2830, r2827, r2886;
}
{
add.f16x2 r2833, r2824, r2830;
}
{
sub.f16x2 r2836, %107, %102;
}
{
mul.f16x2 r2839, r2836, r2895;
}
{
sub.f16x2 r2842, %98, %106;
}
{
mul.f16x2 r2845, r2842, r2901;
}
{
add.f16x2 r2848, r2839, r2845;
}
{
sub.f16x2 r2851, %101, %111;
}
{
mul.f16x2 r2854, r2851, r2910;
}
{
add.f16x2 r2857, r2848, r2854;
}
{
add.f16x2 r2860, r2833, r2857;
}
{
add.f16x2 r2863, %104, %100;
}
{
mul.f16x2 r2866, r2863, r2868;
}
{
add.f16x2 r2869, %105, r2866;
}
{
add.f16x2 r2872, %109, %103;
}
{
mul.f16x2 r2875, r2872, r2877;
}
{
add.f16x2 r2878, r2869, r2875;
}
{
add.f16x2 r2881, %99, %108;
}
{
mul.f16x2 r2884, r2881, r2886;
}
{
add.f16x2 r2887, r2878, r2884;
}
{
sub.f16x2 r2890, %107, %102;
}
{
mul.f16x2 r2893, r2890, r2895;
}
{
sub.f16x2 r2896, %98, %106;
}
{
mul.f16x2 r2899, r2896, r2901;
}
{
add.f16x2 r2902, r2893, r2899;
}
{
sub.f16x2 r2905, %101, %111;
}
{
mul.f16x2 r2908, r2905, r2910;
}
{
add.f16x2 r2911, r2902, r2908;
}
{
sub.f16x2 r2914, r2887, r2911;
}
{
cvt.rn.f16.f64 rs83, fd95;
}
{
cvt.rn.f16.f64 rs84, fd116;
}
{
cvt.rn.f16.f64 rs85, fd99;
}
{
cvt.rn.f16.f64 rs86, fd113;
}
{
cvt.rn.f16.f64 rs87, fd103;
}
{
cvt.rn.f16.f64 rs88, fd117;
}
{
cvt.rn.f16.f64 rs89, fd118;
}
{
cvt.rn.f16.f64 rs90, fd117;
}
{
cvt.rn.f16.f64 rs91, fd114;
}
{
cvt.rn.f16.f64 rs92, fd113;
}
{
cvt.rn.f16.f64 rs93, fd115;
}
{
cvt.rn.f16.f64 rs94, fd116;
}
mov.b32 r2931, {rs83, rs83};
{
mul.f16x2 r2917, r2320, r2931;
}
mov.b32 r2928, {rs84, rs84};
{
mul.f16x2 r2920, r2644, r2928;
}
{
sub.f16x2 r2923, r2917, r2920;
}
{
mul.f16x2 r2926, r2320, r2928;
}
{
fma.rn.f16x2 r2929, r2644, r2931, r2926;
}
mov.b32 r2947, {rs85, rs85};
{
mul.f16x2 r2933, r2428, r2947;
}
mov.b32 r2944, {rs86, rs86};
{
mul.f16x2 r2936, r2752, r2944;
}
{
sub.f16x2 r2939, r2933, r2936;
}
{
mul.f16x2 r2942, r2428, r2944;
}
{
fma.rn.f16x2 r2945, r2752, r2947, r2942;
}
mov.b32 r2963, {rs87, rs87};
{
mul.f16x2 r2949, r2536, r2963;
}
mov.b32 r2960, {rs88, rs88};
{
mul.f16x2 r2952, r2860, r2960;
}
{
sub.f16x2 r2955, r2949, r2952;
}
{
mul.f16x2 r2958, r2536, r2960;
}
{
fma.rn.f16x2 r2961, r2860, r2963, r2958;
}
mov.b32 r2979, {rs89, rs89};
{
mul.f16x2 r2965, r2590, r2979;
}
mov.b32 r2976, {rs90, rs90};
{
mul.f16x2 r2968, r2914, r2976;
}
{
sub.f16x2 r2971, r2965, r2968;
}
{
mul.f16x2 r2974, r2590, r2976;
}
{
fma.rn.f16x2 r2977, r2914, r2979, r2974;
}
mov.b32 r2995, {rs91, rs91};
{
mul.f16x2 r2981, r2482, r2995;
}
mov.b32 r2992, {rs92, rs92};
{
mul.f16x2 r2984, r2806, r2992;
}
{
sub.f16x2 r2987, r2981, r2984;
}
{
mul.f16x2 r2990, r2482, r2992;
}
{
fma.rn.f16x2 r2993, r2806, r2995, r2990;
}
mov.b32 r3011, {rs93, rs93};
{
mul.f16x2 r2997, r2374, r3011;
}
mov.b32 r3008, {rs94, rs94};
mov.f64 fd149, 0d3FDBC4C04D71ABC1;
mov.f64 fd148, 0d3FE904C37505DE4B;
mov.f64 fd147, 0d3FEF329C0558E969;
{
mul.f16x2 r3000, r2698, r3008;
}
{
sub.f16x2 r3003, r2997, r3000;
}
{
mul.f16x2 r3006, r2374, r3008;
}
{
fma.rn.f16x2 r3009, r2698, r3011, r3006;
}
{
add.f16x2 r3013, r1564, r2248;
}
{
add.f16x2 r3016, r1582, r2266;
}
{
sub.f16x2 r3019, r1564, r2248;
}
{
sub.f16x2 r3022, r1582, r2266;
}
{
add.f16x2 r3025, r1636, r2923;
}
{
add.f16x2 r3028, r1960, r2929;
}
{
sub.f16x2 r3031, r1636, r2923;
}
{
sub.f16x2 r3034, r1960, r2929;
}
{
add.f16x2 r3037, r1744, r2939;
}
{
add.f16x2 r3040, r2068, r2945;
}
{
sub.f16x2 r3043, r1744, r2939;
}
{
sub.f16x2 r3046, r2068, r2945;
}
{
add.f16x2 r3049, r1852, r2955;
}
{
add.f16x2 r3052, r2176, r2961;
}
{
sub.f16x2 r3055, r1852, r2955;
}
{
sub.f16x2 r3058, r2176, r2961;
}
{
add.f16x2 r3061, r1906, r2971;
}
{
add.f16x2 r3064, r2230, r2977;
}
{
sub.f16x2 r3067, r1906, r2971;
}
{
sub.f16x2 r3070, r2230, r2977;
}
{
add.f16x2 r3073, r1798, r2987;
}
{
add.f16x2 r3076, r2122, r2993;
}
{
sub.f16x2 r3079, r1798, r2987;
}
{
sub.f16x2 r3082, r2122, r2993;
}
{
add.f16x2 r3085, r1690, r3003;
}
{
add.f16x2 r3088, r2014, r3009;
}
{
sub.f16x2 r3091, r1690, r3003;
}
{
sub.f16x2 r3094, r2014, r3009;
}
{
cvt.rn.f16.f64 rs109, fd147;
}
{
cvt.rn.f16.f64 rs110, fd118;
}
{
cvt.rn.f16.f64 rs111, fd95;
}
{
cvt.rn.f16.f64 rs112, fd116;
}
{
cvt.rn.f16.f64 rs113, fd148;
}
{
cvt.rn.f16.f64 rs114, fd114;
}
{
cvt.rn.f16.f64 rs115, fd99;
}
{
cvt.rn.f16.f64 rs116, fd113;
}
{
cvt.rn.f16.f64 rs117, fd149;
}
{
cvt.rn.f16.f64 rs118, fd115;
}
{
cvt.rn.f16.f64 rs119, fd103;
}
{
cvt.rn.f16.f64 rs120, fd117;
}
{
cvt.rn.f16.f64 rs123, fd118;
}
{
cvt.rn.f16.f64 rs124, fd117;
}
{
cvt.rn.f16.f64 rs125, fd116;
}
{
cvt.rn.f16.f64 rs126, fd115;
}
{
cvt.rn.f16.f64 rs127, fd114;
}
{
cvt.rn.f16.f64 rs128, fd113;
}
{
cvt.rn.f16.f64 rs129, fd113;
}
{
cvt.rn.f16.f64 rs130, fd114;
}
{
cvt.rn.f16.f64 rs131, fd115;
}
{
cvt.rn.f16.f64 rs132, fd116;
}
{
cvt.rn.f16.f64 rs133, fd117;
}
{
cvt.rn.f16.f64 rs134, fd118;
}
mov.b32 r3111, {rs109, rs109};
{
mul.f16x2 r3097, r3025, r3111;
}
mov.b32 r3108, {rs110, rs110};
{
mul.f16x2 r3100, r3028, r3108;
}
{
sub.f16x2 r3103, r3097, r3100;
}
{
mul.f16x2 r3106, r3025, r3108;
}
{
fma.rn.f16x2 r3109, r3028, r3111, r3106;
}
mov.b32 r3127, {rs111, rs111};
{
mul.f16x2 r3113, r3037, r3127;
}
mov.b32 r3124, {rs112, rs112};
{
mul.f16x2 r3116, r3040, r3124;
}
{
sub.f16x2 r3119, r3113, r3116;
}
{
mul.f16x2 r3122, r3037, r3124;
}
{
fma.rn.f16x2 r3125, r3040, r3127, r3122;
}
mov.b32 r3143, {rs113, rs113};
{
mul.f16x2 r3129, r3049, r3143;
}
mov.b32 r3140, {rs114, rs114};
{
mul.f16x2 r3132, r3052, r3140;
}
{
sub.f16x2 r3135, r3129, r3132;
}
{
mul.f16x2 r3138, r3049, r3140;
}
{
fma.rn.f16x2 r3141, r3052, r3143, r3138;
}
mov.b32 r3159, {rs115, rs115};
{
mul.f16x2 r3145, r3061, r3159;
}
mov.b32 r3156, {rs116, rs116};
{
mul.f16x2 r3148, r3064, r3156;
}
{
sub.f16x2 r3151, r3145, r3148;
}
{
mul.f16x2 r3154, r3061, r3156;
}
{
fma.rn.f16x2 r3157, r3064, r3159, r3154;
}
mov.b32 r3175, {rs117, rs117};
{
mul.f16x2 r3161, r3073, r3175;
}
mov.b32 r3172, {rs118, rs118};
{
mul.f16x2 r3164, r3076, r3172;
}
{
sub.f16x2 r3167, r3161, r3164;
}
{
mul.f16x2 r3170, r3073, r3172;
}
{
fma.rn.f16x2 r3173, r3076, r3175, r3170;
}
mov.b32 r3191, {rs119, rs119};
{
mul.f16x2 r3177, r3085, r3191;
}
mov.b32 r3188, {rs120, rs120};
{
mul.f16x2 r3180, r3088, r3188;
}
{
sub.f16x2 r3183, r3177, r3180;
}
{
mul.f16x2 r3186, r3085, r3188;
}
{
fma.rn.f16x2 r3189, r3088, r3191, r3186;
}
{
neg.f16x2 r3193, r3019;
}
mov.b32 r3209, {rs123, rs123};
{
mul.f16x2 r3195, r3031, r3209;
}
mov.b32 r3206, {rs124, rs124};
{
mul.f16x2 r3198, r3034, r3206;
}
{
sub.f16x2 r3201, r3195, r3198;
}
{
mul.f16x2 r3204, r3031, r3206;
}
{
fma.rn.f16x2 r3207, r3034, r3209, r3204;
}
mov.b32 r3225, {rs125, rs125};
{
mul.f16x2 r3211, r3043, r3225;
}
mov.b32 r3222, {rs126, rs126};
{
mul.f16x2 r3214, r3046, r3222;
}
{
sub.f16x2 r3217, r3211, r3214;
}
{
mul.f16x2 r3220, r3043, r3222;
}
{
fma.rn.f16x2 r3223, r3046, r3225, r3220;
}
mov.b32 r3241, {rs127, rs127};
{
mul.f16x2 r3227, r3055, r3241;
}
mov.b32 r3238, {rs128, rs128};
{
mul.f16x2 r3230, r3058, r3238;
}
{
sub.f16x2 r3233, r3227, r3230;
}
{
mul.f16x2 r3236, r3055, r3238;
}
{
fma.rn.f16x2 r3239, r3058, r3241, r3236;
}
mov.b32 r3257, {rs129, rs129};
{
mul.f16x2 r3243, r3067, r3257;
}
mov.b32 r3254, {rs130, rs130};
{
mul.f16x2 r3246, r3070, r3254;
}
{
sub.f16x2 r3249, r3243, r3246;
}
{
mul.f16x2 r3252, r3067, r3254;
}
{
fma.rn.f16x2 r3255, r3070, r3257, r3252;
}
mov.b32 r3273, {rs131, rs131};
{
mul.f16x2 r3259, r3079, r3273;
}
mov.b32 r3270, {rs132, rs132};
{
mul.f16x2 r3262, r3082, r3270;
}
{
sub.f16x2 r3265, r3259, r3262;
}
{
mul.f16x2 r3268, r3079, r3270;
}
{
fma.rn.f16x2 r3271, r3082, r3273, r3268;
}
mov.b32 r3289, {rs133, rs133};
{
mul.f16x2 r3275, r3091, r3289;
}
mov.b32 r3286, {rs134, rs134};
{
mul.f16x2 r3278, r3094, r3286;
}
{
sub.f16x2 r3281, r3275, r3278;
}
{
mul.f16x2 r3284, r3091, r3286;
}
{
fma.rn.f16x2 r3287, r3094, r3289, r3284;
}
{
add.f16x2 %0, r1465, r3013;
}
{
add.f16x2 %1, r1468, r3016;
}
{
sub.f16x2 %28, r1465, r3013;
}
{
sub.f16x2 %29, r1468, r3016;
}
{
add.f16x2 %2, r1477, r3103;
}
{
add.f16x2 %3, r1480, r3109;
}
{
sub.f16x2 %30, r1477, r3103;
}
{
sub.f16x2 %31, r1480, r3109;
}
{
add.f16x2 %4, r1489, r3119;
}
{
add.f16x2 %5, r1492, r3125;
}
{
sub.f16x2 %32, r1489, r3119;
}
{
sub.f16x2 %33, r1492, r3125;
}
{
add.f16x2 %6, r1501, r3135;
}
{
add.f16x2 %7, r1504, r3141;
}
{
sub.f16x2 %34, r1501, r3135;
}
{
sub.f16x2 %35, r1504, r3141;
}
{
add.f16x2 %8, r1513, r3151;
}
{
add.f16x2 %9, r1516, r3157;
}
{
sub.f16x2 %36, r1513, r3151;
}
{
sub.f16x2 %37, r1516, r3157;
}
{
add.f16x2 %10, r1525, r3167;
}
{
add.f16x2 %11, r1528, r3173;
}
{
sub.f16x2 %38, r1525, r3167;
}
{
sub.f16x2 %39, r1528, r3173;
}
{
add.f16x2 %12, r1537, r3183;
}
{
add.f16x2 %13, r1540, r3189;
}
{
sub.f16x2 %40, r1537, r3183;
}
{
sub.f16x2 %41, r1540, r3189;
}
{
add.f16x2 %14, r1471, r3022;
}
{
add.f16x2 %15, r1474, r3193;
}
{
sub.f16x2 %42, r1471, r3022;
}
{
sub.f16x2 %43, r1474, r3193;
}
{
add.f16x2 %16, r1483, r3201;
}
{
add.f16x2 %17, r1486, r3207;
}
{
sub.f16x2 %44, r1483, r3201;
}
{
sub.f16x2 %45, r1486, r3207;
}
{
add.f16x2 %18, r1495, r3217;
}
{
add.f16x2 %19, r1498, r3223;
}
{
sub.f16x2 %46, r1495, r3217;
}
{
sub.f16x2 %47, r1498, r3223;
}
{
add.f16x2 %20, r1507, r3233;
}
{
add.f16x2 %21, r1510, r3239;
}
{
sub.f16x2 %48, r1507, r3233;
}
{
sub.f16x2 %49, r1510, r3239;
}
{
add.f16x2 %22, r1519, r3249;
}
{
add.f16x2 %23, r1522, r3255;
}
{
sub.f16x2 %50, r1519, r3249;
}
{
sub.f16x2 %51, r1522, r3255;
}
{
add.f16x2 %24, r1531, r3265;
}
{
add.f16x2 %25, r1534, r3271;
}
{
sub.f16x2 %52, r1531, r3265;
}
{
sub.f16x2 %53, r1534, r3271;
}
{
add.f16x2 %26, r1543, r3281;
}
{
add.f16x2 %27, r1546, r3287;
}
{
sub.f16x2 %54, r1543, r3281;
}
{
sub.f16x2 %55, r1546, r3287;
}
})"
     : "=r"(__HALF2_TO_UI(rmem[0].x)), "=r"(__HALF2_TO_UI(rmem[0].y)), "=r"(__HALF2_TO_UI(rmem[1].x)), "=r"(__HALF2_TO_UI(rmem[1].y)), "=r"(__HALF2_TO_UI(rmem[2].x)), "=r"(__HALF2_TO_UI(rmem[2].y)), "=r"(__HALF2_TO_UI(rmem[3].x)), "=r"(__HALF2_TO_UI(rmem[3].y)), "=r"(__HALF2_TO_UI(rmem[4].x)), "=r"(__HALF2_TO_UI(rmem[4].y)), "=r"(__HALF2_TO_UI(rmem[5].x)), "=r"(__HALF2_TO_UI(rmem[5].y)), "=r"(__HALF2_TO_UI(rmem[6].x)), "=r"(__HALF2_TO_UI(rmem[6].y)), "=r"(__HALF2_TO_UI(rmem[7].x)), "=r"(__HALF2_TO_UI(rmem[7].y)), "=r"(__HALF2_TO_UI(rmem[8].x)), "=r"(__HALF2_TO_UI(rmem[8].y)), "=r"(__HALF2_TO_UI(rmem[9].x)), "=r"(__HALF2_TO_UI(rmem[9].y)), "=r"(__HALF2_TO_UI(rmem[10].x)), "=r"(__HALF2_TO_UI(rmem[10].y)), "=r"(__HALF2_TO_UI(rmem[11].x)), "=r"(__HALF2_TO_UI(rmem[11].y)), "=r"(__HALF2_TO_UI(rmem[12].x)), "=r"(__HALF2_TO_UI(rmem[12].y)), "=r"(__HALF2_TO_UI(rmem[13].x)), "=r"(__HALF2_TO_UI(rmem[13].y)), "=r"(__HALF2_TO_UI(rmem[14].x)), "=r"(__HALF2_TO_UI(rmem[14].y)), "=r"(__HALF2_TO_UI(rmem[15].x)), "=r"(__HALF2_TO_UI(rmem[15].y)), "=r"(__HALF2_TO_UI(rmem[16].x)), "=r"(__HALF2_TO_UI(rmem[16].y)), "=r"(__HALF2_TO_UI(rmem[17].x)), "=r"(__HALF2_TO_UI(rmem[17].y)), "=r"(__HALF2_TO_UI(rmem[18].x)), "=r"(__HALF2_TO_UI(rmem[18].y)), "=r"(__HALF2_TO_UI(rmem[19].x)), "=r"(__HALF2_TO_UI(rmem[19].y)), "=r"(__HALF2_TO_UI(rmem[20].x)), "=r"(__HALF2_TO_UI(rmem[20].y)), "=r"(__HALF2_TO_UI(rmem[21].x)), "=r"(__HALF2_TO_UI(rmem[21].y)), "=r"(__HALF2_TO_UI(rmem[22].x)), "=r"(__HALF2_TO_UI(rmem[22].y)), "=r"(__HALF2_TO_UI(rmem[23].x)), "=r"(__HALF2_TO_UI(rmem[23].y)), "=r"(__HALF2_TO_UI(rmem[24].x)), "=r"(__HALF2_TO_UI(rmem[24].y)), "=r"(__HALF2_TO_UI(rmem[25].x)), "=r"(__HALF2_TO_UI(rmem[25].y)), "=r"(__HALF2_TO_UI(rmem[26].x)), "=r"(__HALF2_TO_UI(rmem[26].y)), "=r"(__HALF2_TO_UI(rmem[27].x)), "=r"(__HALF2_TO_UI(rmem[27].y)): "r"(__HALF2_TO_UI(rmem[16].x)), "r"(__HALF2_TO_UI(rmem[8].x)), "r"(__HALF2_TO_UI(rmem[12].y)), "r"(__HALF2_TO_UI(rmem[24].y)), "r"(__HALF2_TO_UI(rmem[12].x)), "r"(__HALF2_TO_UI(rmem[24].x)), "r"(__HALF2_TO_UI(rmem[20].y)), "r"(__HALF2_TO_UI(rmem[4].y)), "r"(__HALF2_TO_UI(rmem[0].y)), "r"(__HALF2_TO_UI(rmem[20].x)), "r"(__HALF2_TO_UI(rmem[4].x)), "r"(__HALF2_TO_UI(rmem[16].y)), "r"(__HALF2_TO_UI(rmem[8].y)), "r"(__HALF2_TO_UI(rmem[0].x)), "r"(__HALF2_TO_UI(rmem[2].y)), "r"(__HALF2_TO_UI(rmem[22].x)), "r"(__HALF2_TO_UI(rmem[6].x)), "r"(__HALF2_TO_UI(rmem[18].y)), "r"(__HALF2_TO_UI(rmem[10].y)), "r"(__HALF2_TO_UI(rmem[2].x)), "r"(__HALF2_TO_UI(rmem[18].x)), "r"(__HALF2_TO_UI(rmem[10].x)), "r"(__HALF2_TO_UI(rmem[14].y)), "r"(__HALF2_TO_UI(rmem[26].y)), "r"(__HALF2_TO_UI(rmem[14].x)), "r"(__HALF2_TO_UI(rmem[26].x)), "r"(__HALF2_TO_UI(rmem[22].y)), "r"(__HALF2_TO_UI(rmem[6].y)), "r"(__HALF2_TO_UI(rmem[25].x)), "r"(__HALF2_TO_UI(rmem[21].y)), "r"(__HALF2_TO_UI(rmem[5].y)), "r"(__HALF2_TO_UI(rmem[1].y)), "r"(__HALF2_TO_UI(rmem[5].x)), "r"(__HALF2_TO_UI(rmem[21].x)), "r"(__HALF2_TO_UI(rmem[17].y)), "r"(__HALF2_TO_UI(rmem[9].y)), "r"(__HALF2_TO_UI(rmem[1].x)), "r"(__HALF2_TO_UI(rmem[17].x)), "r"(__HALF2_TO_UI(rmem[9].x)), "r"(__HALF2_TO_UI(rmem[13].y)), "r"(__HALF2_TO_UI(rmem[25].y)), "r"(__HALF2_TO_UI(rmem[13].x)), "r"(__HALF2_TO_UI(rmem[11].x)), "r"(__HALF2_TO_UI(rmem[15].y)), "r"(__HALF2_TO_UI(rmem[27].y)), "r"(__HALF2_TO_UI(rmem[15].x)), "r"(__HALF2_TO_UI(rmem[27].x)), "r"(__HALF2_TO_UI(rmem[23].y)), "r"(__HALF2_TO_UI(rmem[7].y)), "r"(__HALF2_TO_UI(rmem[3].y)), "r"(__HALF2_TO_UI(rmem[23].x)), "r"(__HALF2_TO_UI(rmem[7].x)), "r"(__HALF2_TO_UI(rmem[19].y)), "r"(__HALF2_TO_UI(rmem[11].y)), "r"(__HALF2_TO_UI(rmem[3].x)), "r"(__HALF2_TO_UI(rmem[19].x)));
};


#endif
